import requests
from bs4 import BeautifulSoup

# bs4 进行数据解析
if __name__ == '__main__':
    # 将本地的html文档中的数据加载到该对象中
    fp = open("./test.html", "r", encoding="utf-8")
    soup = BeautifulSoup(fp, "lxml")
    # print(soup.a)  # soup.tagName 返回的是html中第一次出现的tagName对应的标签
    # print(soup.div)
    # print(soup.find("div")) # print(soup.div)一样  find("tagName") 等同于soup.div
    # print(soup.find("div",class_=  "app-qrcode-title")) #  属性定位
    # print(soup.find_all("a")) #  返回列表，返回符合要求的所有标签
    #
    # select 函数 select("某种选择器
    print(soup.select(".app-qrcode-split"))
    print(soup.select(".tang > ul > li > a")[0])  # 层级选择器
    print(soup.select(".tang > ul  a"))  # 空格标识多个层级，> 表示一个层级
    # 获取标签之间的文本数据  text/get_text()可以获取标签中所有的文本内容（不是直系标签也可以) string获取的是直系的文本内容
    a1 = soup.a.text
    a2 = soup.a.string
    a3 = soup.a.get_text()


    # 获取标签中属性值
    abb = soup.a["href"]

    # 将互联网上获取的页面源码加载到该对象中

    # soup的属性
